为你的大脑搜罗「训练数据」
原文:Scraping training data for your mind - by Henrik Karlsson
2022 年 9 月 21 日
在卡尔·奥韦·克瑙斯高的自传体小说《我的奋斗》读到第 2432 页时,一个关键的情节点出现了:普鲁斯特作品的新挪威语译本出版了。
克瑙斯高当时二十五六岁,已花费近十年光阴学习写作。说得委婉些,他并未成功。他的挚友托雷·伦伯格读完他的作品后,有一次来到克瑙斯高的公寓,看起来像是来之前喝了点酒给自己壮胆。
「可是卡尔·奥韦,」伦伯格谈及他的文字时说,「你的文字……空无一物。」
这并非我们首次见识到人们对克瑙斯高文风的反应。在书的前半部分,当他在挪威北部一个偏远的渔村担任教师时,克瑙斯高回到家,发现同事们正围读他写的一段性爱场景,并大声嘲笑。克瑙斯高——当时仍是处男——径直穿过厨房,走进书房,一口气灌下一整瓶红酒,随即吐了满书柜都是。
但伦伯格的批评更为刺骨。伦伯格比克瑙斯高年轻,却已是一位卓有成就的作家,他清楚自己在说什么。那文字里,当真空无一物。
于是克瑙斯高停止了写作。当普鲁斯特《追寻逝去的时光》的新译本出版时,他已有两年未曾动笔。在春日的光影下,他读完了普鲁斯特的七卷本回忆录,如「饮水一杯」般一气呵成。他说,那感觉就像「重访一座你许久以前曾待过的森林……当你迈步其间,记忆便开始复苏」。
在那次顿悟之后……他又蹉跎了两年光阴,没有写作。这在他的自传里,大约占了 200 页的篇幅。
接着,不知何故,挪威最大出版社的子公司 Tiden 的一位编辑——此人与旁人无异,对克瑙斯高的写作同样毫无信心——却决定,嗯,何不干脆给他一份出书合同。克瑙斯高抛下一切,搬回母亲居住的城镇阿伦达尔,着手创作他的处女作小说。他不知该写些什么。他在图书馆无意中听到一段对话,便将其记下,然后以此为起点即兴发挥。
这部小说最终讲述了一位 26 岁教师亨里克·万克尔的故事。与许多处女作一样,它很难不被解读为自传——而当情节聚焦于万克尔与他 13 岁的学生米丽亚姆,在一个与克瑙斯高曾在挪威北部任教的渔村别无二致的小镇上发生的性关系时,故事的张力愈发凸显。这本书一经问世,便在评论界和市场上双双大获成功。
成功的原因之一,在于其文风是纯粹的普鲁斯特式的。普鲁斯特式的感性,那种对时间与记忆的迷恋,那种丰饶而清澈的语言,如病毒般贯穿了《Ude af verden》的每一个句子。克瑙斯高声称他当时并未意识到这股影响——但《追寻逝去的时光》中的某些东西已然融入他的肌理,重塑了他的感知。在他停笔的那两年里,他的写作已然脱胎换骨。
这对作家而言是常事。当读到某些极具力量的作品时,其声音会感染他们。有时这会成为一种弱点,倘若那股影响未能转化为个人化的东西。但这也是必经之路:找到好的影响,是写出好作品的先决条件。
有些作家会非常刻意地这样做。沃纳·赫尔佐格在写剧本前,会花上数日阅读《诗体埃达》,并把古典乐开到最大音量,让自己进入一种他称之为「语言的狂喜」的状态。约翰·弗鲁申特,正如我们在本系列上一篇中讨论的,在创作歌曲时也会做类似的事。
让我们将此称为为你的大脑搜罗优质的「训练数据」。这是一项至关重要的技能,却常被忽视。学习一门新手艺时,人们很容易一上来就追求掌握各种具体任务。你想知道如何组织语句,于是你去读《风格的要素》。你想弄清如何更高效地使用谷歌学术,于是你背下了布尔运算符。这些固然重要,但要真正精通一件事——无论是育儿、编程还是做研究——你还需要内化该领域的顶尖范例。懂得如何找到这些范例,处在你需要掌握的各项具体技能的上游。
正如伊拉斯谟在《论学习方法》中所言:
我们掌握一门语言,并非通过学习规则,而是通过与那些习惯于精准、优雅地表达的人日日相处,并通过大量阅读最杰出的作家。
在《我们先塑造自己的社交图谱,它再反过来塑造我们》一文中,我们将人建模为在社交图谱中传递信息的节点。(伊拉斯谟刚刚将上述引言从公元 1511 年传递给了我,我又将它传递给了你。)在这个模型中,你的输出质量可以被视为取决于你信息流上游的那些节点。在克瑙斯高将普鲁斯特接入他的图谱之前,他无法产出有价值的文学作品。
换言之:对卓越的追求,可以被重新定义为一个搜索问题。在信息过剩的世界里,你如何找到好的影响?
论定位卓越花园的艺术
近来,随着孩子日渐长大,我的妻子约翰娜开始专心解决我们家花园这个难题。她对园艺知之甚少。但她在学习方法上比我更为审慎,我便一直在旁观察并记录她是如何着手的。
起初,和我们大多数人一样,约翰娜在图书馆翻阅园艺书籍。她在村里探头越过篱笆张望,用谷歌搜索花卉搭配,在 Instagram 上寻找灵感。要是我,可能就到此为止了。(或者更糟,我或许会像我认识的一位诗人,走过图书馆时轻蔑地说:「书!我不需要书!我有我的诗!」结果这成了写出蹩脚诗歌的绝佳途径。)
是的,约翰娜说,通过谷歌的确能找到美丽的花园。但是,在对一个领域没有良好感觉的情况下,你无法判断这些花园是否已臻化境。
为了找到一个更好的切入点来进入园艺文化,约翰娜将焦点从花园本身移开。她上升一个维度去思考,转而寻找那些善于品鉴花园的人。她去查阅各种奖项。在浏览了花园设计师协会终身成就奖的历届得主后,她发现了皮特·奥多夫和贝丝·查托。这批影响力人物,远胜于她用那种直接搜索事物本身的朴素方法所找到的。她还发现了安德鲁·劳森,一位在 2013 年获此殊荣的摄影师——通过他的影像,她发现了更多精妙绝伦的花园。如今,他们的言语和图像,他们花园的蓝图,正源源不断地成为输入她大脑的养料。
这个原则——寻找能指引你抵达领域之巅的人——具有极强的普适性。这不仅限于查阅奖项。阅读某个科学领域的综述文章是另一种方法。研究公认的经典。观察你所能发现的最有才华的人,并弄清他们正在学习谁。你可以通过阅读访谈来寻找答案,或查看智者们都在引用谁的成果,等等。如果你迭代数次,顺着引用之藤从一个好的源头攀爬至一个更好的源头,你很快就能整理出一份名单,上面是那些处于你所在领域顶峰的人物(或书籍、文章、花园、画作等)。去研究他们。
但是,模仿那些只比你领先一步的人不是更好吗?这样你可以待在自己的「最近发展区」内。为何要从一个领域的最高成就看起?因为这能让你塑造品味,使其与巅峰之作对齐。正如迈克尔·尼尔森在谈及进入一个新科学领域时所指出的:
你或许会认为,打基础就是浅读大量的论文。但实际上,要真正领会一个陌生的领域,你需要深度研读关键论文——比如 AlphaGo 的那篇。你从深度研读重要论文中获得的,远比任何单一的事实或技术都更重要:你得以感知到该领域一项重磅成果应有的样貌。它助你汲取该领域最健康的规范与标准。它助你内化如何在该领域提出好问题,以及如何组合运用各种技术。你开始理解像 AlphaGo 这样的成果何以成为突破——同时也理解其局限性,以及在何种意义上它其实是该领域发展的自然演进。
你可以像尼尔森那样,非常主动地运用间隔重复法来深度研读关键论文。或者,你也可以仅仅让那些论文(或花园,或任何形式的输入)萦绕在你周围,并相信它们会自行在你身上留下印记。何塞·林孔(他与尼尔森一样,以能迅速进入并总结新领域而闻名)采用的便是这种更被动、类似机器学习的方法:他将自己浸泡在成百上千篇论文的海洋里,不太担心是否无法理解某些内容。他相信只要给大脑喂养足够的数据,它便会开始从中提取模式。约翰娜也是如此。她浏览几十本园艺书籍,逐渐建立起模式识别的能力,能叫出各种宿根植物和丛生植物的名字;能分辨花境和飘种带;能认出狐尾草、圆叶葡萄、刺甘蓝和一枝黄花。
偏爱未经雕琢的原始输入
在做这件事时,你希望你观察到的输入尽可能地与实践紧密相连。你想看到过程,而不仅仅是结果。结果往往具有误导性。如果你是一位音乐家,去观察那些成功的乐队,你可能会产生一种错觉,认为必须制作音乐视频才能成功,而事实上,视频只有在你取得了一定的成功之后才有意义——因此,模仿这一点会让你错配自己的时间。
如果你依赖于那些脱离了实际过程的建议和解释,你同样会被引入歧途。专家们很少能清晰地阐述那些让他们达到高水平表现的行为。知识是默会的。他们的解释是事后归因,并不能真正产生那些结果。
但如果你去观察他们的实践过程,如果你贴近它,所有奥秘尽在其中。
塞德里克·陈有一个精彩的关于此问题的系列文章。在第四部分,他描述了人们如何开始利用 YouTube 从那些他们无法接触到的人身上提取隐性知识。陈观察到,诀窍在于观看原始素材,而不仅仅是教学视频。他引用了对马来西亚柔道教练 Oon Yeoh 的一次访谈:
假设你想学习某位选手如何运用某项特定技术。以下是一些最佳实践:
a) 不要只看一两个这位选手使用该技术的例子。要观看多个例子,并尝试找出该选手在为投技做铺垫时的趋势或习惯。[…]
c) 有时技术会失败。也要观看这些失败的例子,并试着理解问题出在哪里。这次尝试与成功时有何不同?这样做能让你剥离出关键的成功要素。
d) 尝试留意技术上的变化。有时这些差异非常细微,却至关重要。理解这些变化(它们在何时被使用,以及为何这些变化是必要的)会让你对这项技术有更深的把握。
e) 用慢动作观看技术通常很有帮助。如果视频没有慢动作回放,你可能需要自己下载视频,用简单的视频编辑软件将其放慢。我当学生那会儿还没有数字视频,只有 VHS 录像带,我得用两台录像机来制作古贺选手投技的慢动作循环播放,只为了能好好地研究它们!
观看安迪·马图沙克的笔记直播,能让你领会到他本人也无法言传的思维模式。观看一百个花园设计师重新规划花园布局的案例,能让你在脑中构建起一个远比园艺书籍中的描述要丰富得多的心智模型。
内省
事情就这么简单吗?
我们是否本可以通过告诉克瑙斯高去研究经典、去近距离观察才华横溢的作家,来加速他的伟大之路?
不。事实上,这正是克瑙斯高所做的——并且失败了。在挣扎着成为作家的岁月里,他在卑尔根大学学习文学。他参加了约恩·福瑟的写作工作坊。福瑟曾一度是欧洲作品上演次数最多的在世剧作家。为何拥有这样一位导师,却未能释放克瑙斯高的才华?
为何阅读经典,反而导致他写出的故事「空无一物」?
在访谈中,克瑙斯高曾提到,在 1990 年代的卑尔根文学圈,构成好作品的标准是极度偏重思辨的。福柯的《词与物》被奉为圣经。这便是克瑙斯高内化的标尺。而问题恰恰在于:克瑙斯高独特的天赋并非思辨,而是情感。正如他的朋友吉尔所说,他能把一个人拉屎的过程写得让你潸然泪下。(当然,普鲁斯特也能做到这一点。)但由于他的同辈对此不屑一顾,他并未意识到这才是他命中注定该做的事。
所以,仅仅识别出好的影响是不足够的。你还需要为深度的内省创造空间,一个让你能探索清楚你与世界如何相互契合的空间。
相互契合?我此话何意?首先,在任何领域,作品都有客观上更精良的标准。你应该朝此努力,应该研究那些精良的作品。但其次,你所专注的方向也应与你的长处、与你好奇心的天然走向相匹配。否则,你会备受煎熬,与自己背道而驰。
找到那些既卓越又契合你的输入——二者缺一,则境界大减。
我们最终得到一个大致如下的流程。你尽己所能地反思你正试图做的事。然后,你试图找到该领域的巅峰之作,并以尽可能高的分辨率去观察它们,连同那些源于真实情境研究所带来的所有纷繁细节。(你不必一上来就找到全局最优解,只要能辨认出梯度在哪里即可。通过从你当前的位置追逐顶峰,你可以通过观察你眼中的「巅峰」所仰望的对象,来继续向更高的山峰攀登,那个对象很可能在更高处。克瑙う斯高背后是普鲁斯特;普鲁斯特背后是夏多布里昂和波德莱尔;波德莱尔背后是戈蒂耶……)偶尔,你需要停下来反思,随着你沿此梯度攀升,你对世界的理解发生了怎样的变化。这座山,值得攀登吗?或者,你是否能望见另一座与你更为契合的山?若然,你便修正航向。
你也可以在一定程度上将此过程自动化。这需要通过公开创作来实现。通过在网上写作,或从事其他类型的公共工作,你的产出得以在互联网上传播,为你寻觅到有趣的同道中人。然后,被你的作品吸引而来的人们会开始向你输送有趣的事物,拉着你向山顶攀登。
如何在实践中做到这一点,将是本系列下一篇文章的主题。
诚挚地,
Henrik